년 2월 AI 및 로봇 동향
1. 서론: 2023년 2월, 생성형 AI와 로봇 공학의 새로운 서막
2023년 2월은 인공지능(AI) 및 로봇 공학 분야의 역사에서 단순한 한 달이 아닌, 패러다임의 전환을 예고하는 중요한 변곡점으로 기록된다. 이 시기는 기술 발전의 속도가 임계점을 넘어 산업계와 학계 전반에 걸쳐 구조적 변화를 촉발한 시점이었다. 특히, Meta의 대규모 언어 모델(LLM) LLaMA 공개는 기존의 폐쇄적인 모델 개발 패러다임에 도전장을 내밀며 기술 민주화의 가능성을 제시했다. 이에 대응하여 Google은 자사의 대화형 AI 서비스 Bard를 전격 발표하며 빅테크 간의 기술 패권 경쟁이 본격화되었음을 알렸다. 동시에, 중국은 ‘로봇+’ 응용 행동 계획을 통해 로봇 기술을 국가 핵심 산업과 통합하려는 거시적 전략을 구체화했다. 이러한 산업계의 격동 속에서 AAAI와 같은 세계 최고 수준의 학술대회에서는 AI의 근본적인 능력과 안전성에 대한 심도 깊은 연구 결과들이 공유되며 기술 발전의 명암을 동시에 조명했다.
이 보고서는 2023년 2월에 발생한 이들 핵심 사건들을 개별적인 현상이 아닌, 상호 연결된 거대한 흐름의 일부로 분석한다. AI 기술의 접근성이 확대되는 동시에 소수 기업에 의한 기술 집중이 심화되는 이중적 현상, 그리고 국가 단위의 로봇 산업 육성 전략이 구체화되는 과정은 2023년 전체 기술 지형도를 결정짓는 중요한 전주곡이었다.1 본 보고서는 LLaMA의 기술적 의의, Bard 발표의 전략적 배경, 중국의 로봇 정책, 그리고 주요 학술 연구의 동향을 심층적으로 분석하여 2023년 2월이 AI와 로봇 공학의 미래에 어떠한 의미를 가지는지 종합적으로 조망하고자 한다.
2. Meta AI의 LLaMA 공개: 파운데이션 모델의 지각 변동
2023년 2월 24일, Meta AI는 논문 “LLaMA: Open and Efficient Foundation Language Models“를 통해 새로운 파운데이션 모델군인 LLaMA를 공개했다.3 이는 단순히 새로운 모델의 등장을 넘어, LLM 연구 및 개발 생태계에 근본적인 변화를 가져온 사건이었다. LLaMA는 거대 자본을 투입한 소수의 기업만이 접근 가능했던 고성능 LLM의 개발이 독점적, 비공개 데이터 없이도 가능하다는 것을 입증하며, AI 연구의 민주화와 개방형 혁신의 기폭제가 되었다.
2.1 LLaMA 모델 아키텍처 및 기술적 의의
LLaMA는 70억(7B)개부터 650억(65B)개의 매개변수를 가진 모델들로 구성된 컬렉션으로, 표준적인 트랜스포머(Transformer) 아키텍처를 기반으로 하되, 안정성과 성능을 극대화하기 위한 몇 가지 핵심적인 개선 사항을 적용했다.4
첫째, 훈련 안정성을 높이기 위해 기존의 LayerNorm 대신 사전 정규화(Pre-normalization) 방식을 채택하고, **RMSNorm(Root Mean Square Layer Normalization)**을 적용했다. 이는 그래디언트 폭주나 소실 문제를 완화하여 더 깊고 큰 모델의 안정적인 학습을 가능하게 한다.
둘째, 활성화 함수로 ReLU(Rectified Linear Unit) 대신 **SwiGLU(Swish-Gated Linear Unit)**를 사용했다. SwiGLU는 성능을 향상시키는 것으로 알려져 있으며, PaLM과 같은 최신 모델에서도 그 효과가 입증된 바 있다.4
셋째, 위치 정보를 인코딩하기 위해 절대적 위치 임베딩(absolute positional embeddings) 대신 **회전 위치 임베딩(Rotary Positional Embeddings, RoPE)**을 도입했다. RoPE는 시퀀스의 길이에 대한 유연성을 높이고, 상대적 위치 정보를 효과적으로 모델링하여 장문(long-sequence) 이해 능력을 개선한다.
이러한 아키텍처 최적화를 통해 LLaMA는 매개변수 대비 높은 효율성을 달성했으며, 이는 AI 연구의 중요한 방향성을 제시했다.
2.2 학습 데이터 및 방법론
LLaMA의 가장 큰 특징 중 하나는 학습 데이터를 오직 공개적으로 접근 가능한 데이터셋으로만 구성했다는 점이다.4 이는 독점적이고 접근 불가능한 데이터에 의존하지 않고도 최첨단 모델을 훈련할 수 있음을 보여준 중요한 성과다. 총 수조(1T∼1.4T) 개의 토큰에 달하는 방대한 데이터는 다음과 같은 소스로부터 수집되었다.3
- Common Crawl: 웹 크롤링 데이터 (67%)
- C4: 정제된 웹 크롤링 데이터 (15%)
- GitHub: 공개 코드 저장소 (4.5%)
- Wikipedia: 다국어 위키피디아 (4.5%)
- Books: 구글 북스 데이터 (4.5%)
- ArXiv: 학술 논문 데이터 (2.5%)
- Stack Exchange: 질의응답 사이트 (2%)
이러한 데이터 구성은 LLaMA가 단순한 언어 이해를 넘어 코드 생성, 학술적 추론 등 다양한 영역에서 높은 성능을 발휘하는 기반이 되었다. 특히, LLaMA의 성공은 ’더 많은 데이터로 훈련된 더 작은 모델이 더 나은 성능을 보인다’는 ’친칠라 스케일링 법칙(Chinchilla scaling laws)’을 강력하게 뒷받침하는 실증적 사례가 되었다. 이는 단순히 매개변수 수를 늘리는 데 집중했던 기존의 ‘모델 중심(model-centric)’ 접근법에서, 고품질 데이터를 대규모로 확보하고 정제하는 ‘데이터 중심(data-centric)’ 접근법으로의 패러다임 전환을 가속화하는 계기가 되었다.
2.3 주요 벤치마크 성능 분석
LLaMA는 매개변수 효율성 측면에서 놀라운 성능을 입증했다. 논문에서 발표된 주요 벤치마크 결과는 다음과 같다.4
- LLaMA-13B (130억 매개변수) 모델은 대부분의 벤치마크에서 13배 이상 큰 GPT-3 (1750억 매개변수) 모델의 성능을 능가했다. 이는 모델의 크기가 성능의 절대적인 척도가 아님을 명확히 보여주었다.
- LLaMA-65B (650억 매개변수) 모델은 당시 최고 수준의 모델로 평가받던 DeepMind의 Chinchilla (700억 매개변수) 및 Google의 PaLM (5400억 매개변수)과 대등한 경쟁력을 보였다.
상식 추론(common sense reasoning), 코드 생성(code generation), 독해(reading comprehension) 등 다양한 분야에서 LLaMA는 뛰어난 성능을 기록하며 파운데이션 모델의 새로운 기준을 제시했다.8 LLaMA는 본래 연구 커뮤니티에 제한적으로 공개될 예정이었으나, 2023년 3월 3일 모델의 가중치가 온라인에 유출되는 사건이 발생했다.3 이 사건은 의도치 않게 LLaMA가 전 세계 개발자 및 연구자들에게 확산되는 계기가 되었고, 이후 폭발적으로 성장한 오픈소스 AI 생태계의 실질적인 기원이 되었다.
| 모델 (Model) | 매개변수 (Parameters) | 학습 토큰 (Training Tokens) | MMLU (5-shot) | TriviaQA (0-shot) |
|---|---|---|---|---|
| GPT-3 | 175B | 300B | 63.4 | 71.2 |
| Chinchilla | 70B | 1.4T | 67.3 | 80.4 |
| PaLM | 540B | 780B | 69.3 | 80.1 |
| LLaMA-13B | 13B | 1.0T | 54.8 | 78.1 |
| LLaMA-65B | 65.2B | 1.4T | 63.4 | 82.0 |
표 1: LLaMA 모델군과 주요 파운데이션 모델 성능 비교 (자료: 3)
3. Google의 Bard 발표와 생성형 AI 경쟁 구도
Meta의 LLaMA가 AI 연구의 개방성을 상징했다면, 같은 달 Google의 움직임은 생성형 AI 시장의 치열한 경쟁 구도를 명확히 보여주었다. OpenAI의 ChatGPT가 전 세계적인 주목을 받으며 검색 시장의 패러다임을 위협하자, Google은 자사의 기술력을 증명하고 시장의 우려를 불식시키기 위해 신속하게 대응에 나섰다.
3.1 LaMDA 기반 대화형 AI 서비스, Bard
2023년 2월 6일, Google은 자사의 대화형 AI 서비스인 Bard를 공식 발표했다.9 Bard는 ’대화 애플리케이션을 위한 언어 모델(Language Models for Dialog Applications)’의 약자인 LaMDA를 기반으로 한다. LaMDA는 최대 1370억(137B) 개의 매개변수를 가지며, 1.56조(1.56T) 단어 규모의 공개 대화 데이터 및 웹 텍스트로 사전 학습된 모델군이다.10
Google의 발표에서 주목할 점은 Bard를 처음에는 LaMDA의 “경량 모델 버전(lightweight model version)“으로 출시한다는 전략이었다.9 이는 더 적은 컴퓨팅 파워를 요구하여 더 많은 사용자에게 서비스를 확장하고, 폭넓은 피드백을 수집하기 위한 결정이었다. 이러한 신중하고 점진적인 접근 방식은 OpenAI가 ChatGPT를 대중에게 전면적으로 공개한 것과는 대조적이었으며, Google이 기술의 안정성과 품질, 그리고 사회적 파장을 얼마나 중요하게 고려하고 있는지를 보여주었다. Bard는 웹의 최신 정보를 활용하여 신선하고 고품질의 응답을 제공하는 것을 목표로 하며, 창의성을 위한 발판이자 호기심을 해결하는 도구로 포지셔닝되었다.9
3.2 AI 생성 콘텐츠에 대한 Google의 공식 입장
Bard와 같은 강력한 생성형 AI의 등장은 필연적으로 새로운 문제를 야기했다. 바로 AI가 생성한 콘텐츠가 웹 생태계, 특히 Google의 핵심 사업인 검색 결과의 품질을 저해할 수 있다는 우려였다. 이에 Google은 Bard 발표 단 이틀 후인 2023년 2월 8일, Google 검색 센터 블로그를 통해 AI 생성 콘텐츠에 대한 공식 가이드라인을 발표하며 시장의 혼란을 조기에 차단하고자 했다.13
이 가이드라인의 핵심 메시지는 **“콘텐츠가 어떻게 만들어졌는지가 아니라, 콘텐츠의 품질이 중요하다”**는 것이었다. 즉, Google은 AI를 사용했다는 이유만으로 콘텐츠에 불이익을 주지 않으며, 오직 고품질 콘텐츠에 보상을 제공한다는 원칙을 명확히 했다. 여기서 ’고품질’의 기준은 Google이 수년간 강조해 온 E-E-A-T, 즉 전문성(Expertise), 경험(Experience), 권위(Authoritativeness), 신뢰성(Trustworthiness) 프레임워크에 기반한다.13
Google은 스포츠 경기 결과나 일기 예보와 같이 유용한 자동화 콘텐츠와, “검색 순위 조작을 주된 목적으로” AI를 사용하여 생성된 스팸성 콘텐츠를 명확히 구분했다. 후자는 명백한 스팸 정책 위반임을 재확인하며, AI 기술의 남용을 경계하는 동시에 책임감 있는 활용을 장려하는 입장을 취했다.13
이러한 일련의 과정은 Google이 처한 복합적인 상황을 드러낸다. OpenAI와 Microsoft의 협공으로 인해 자사의 검색 엔진 패권이 위협받는 상황에서, Google은 Bard를 서둘러 발표하여 기술 경쟁에서 뒤처지지 않았음을 시장에 알려야만 했다. 그러나 이 발표는 동시에 자사 검색 생태계를 위협할 수 있는 ’판도라의 상자’를 여는 행위이기도 했다. 따라서 불과 이틀 만에 발표된 AI 콘텐츠 가이드라인은 Bard 발표로 인해 파생될 수 있는 생태계 교란 위험을 선제적으로 관리하고, 새로운 기술 시대의 ’게임의 법칙’을 스스로 정립하려는 전략적 필연성의 산물이었다. 이처럼 2월 초 Google의 행보는 외부의 경쟁 압력에 대한 명백한 대응이자, 그로 인한 내부적 위험을 통제하려는 이중적 과제를 해결하기 위한 긴박한 움직임이었다.
4. 로봇 공학의 정책적 전환: 중국의 ‘로봇+’ 응용 행동 계획
2023년 초, 서구권에서 생성형 AI 소프트웨어가 기술 담론의 중심에 있었다면, 중국에서는 로봇 공학 하드웨어와 산업 적용을 위한 국가 차원의 청사진이 구체화되고 있었다. 2023년 1월 말에서 2월에 걸쳐 중국 공업정보화부(MIIT)를 포함한 17개 정부 부처는 **‘로봇+(로봇 플러스) 응용 행동 실시 방안(Robot+ Application Action Plan)’**을 공동으로 발표했다.15 이는 단순한 기술 개발 계획을 넘어, 로봇 기술을 국가 경제의 근간이 되는 핵심 산업 전반에 깊숙이 통합시키려는 강력한 의지를 담고 있다.
4.1 계획의 목표와 핵심 내용
‘로봇+’ 계획의 가장 상징적인 목표는 **“2025년까지 제조업 로봇 밀도를 2020년 대비 2배로 늘리는 것”**이다.15 로봇 밀도는 제조업 노동자 1만 명당 사용되는 로봇의 수를 의미하는 지표로, 국가의 스마트 제조 수준을 가늠하는 핵심 척도다. 이 목표는 중국이 노동 집약적 산업 구조에서 벗어나 고부가가치 지능형 제조 강국으로 도약하겠다는 비전을 명확히 보여준다.
계획의 핵심 내용은 다음과 같다:
- 협력적 혁신 시스템 구축: 로봇 생산 기업과 응용 기업 간의 협력을 강화하여 현장 수요에 맞는 로봇 기술 개발을 촉진한다.17
- 표준화 가속: 로봇 응용 표준의 개발과 보급을 서둘러 산업 전반에 걸쳐 로봇 도입의 호환성과 안정성을 높인다.15
- 고품질 경제 발전 기여: 서비스 로봇과 특수 로봇의 활용을 대폭 확대하여 경제 및 사회 발전에 대한 로봇 산업의 기여도를 현저히 향상시킨다.15
4.2 10대 중점 응용 분야 및 기술 혁신
‘로봇+’ 계획은 추상적인 구호에 그치지 않고, 구체적인 응용 분야를 명시하여 정책의 실행력을 높였다. 계획이 지목한 10대 중점 응용 분야는 경제, 사회, 안보를 아우르는 전략적 영역들로 구성된다.15
- 제조업: 디지털 작업장, 스마트 공장 구축 가속화
- 농업: 파종, 수확, 관리 등 농업 생산 전 과정 자동화
- 건축: 위험하고 반복적인 건설 현장 작업 자동화
- 에너지: 발전소, 송전망 등 에너지 인프라 순찰 및 유지보수
- 물류: 창고 자동화, 무인 배송 시스템 확대
- 의료 및 건강: 수술 보조, 재활 치료, 노인 및 장애인 돌봄
- 노인 돌봄 서비스: 고령화 사회 대응을 위한 생활 보조 및 건강 모니터링
- 교육: 실습 교육, 특수 교육 지원
- 상업 및 커뮤니티 서비스: 안내, 청소, 방역 등 공공 서비스
- 안전 및 응급 관리: 재난 구조, 위험물 처리, 공공 안전 순찰
이와 함께, 100개 이상의 혁신적인 응용 기술 및 솔루션 개발, 그리고 200개 이상의 최첨단 기술 시범 응용 시나리오 발굴이라는 구체적인 수치 목표를 제시했다.15
이러한 중국의 ‘로봇+’ 계획은 단순한 기술 진흥 정책이 아니라, 국가가 직면한 복합적인 도전에 대한 전략적 대응으로 해석해야 한다. 중국은 급속한 고령화와 인구 감소라는 내부적 인구 구조의 압박에 직면해 있으며, 이를 극복하고 생산성을 유지·향상시키기 위해 자동화는 선택이 아닌 필수다.20 동시에, 미중 기술 패권 경쟁과 같은 지정학적 긴장이 고조되는 상황에서 핵심 부품을 포함한 로봇 산업의 자급자족 생태계를 구축하는 것은 경제 안보와 직결되는 문제다. 따라서 ‘로봇+’ 계획은 내부의 인구학적 약점을 보완하고, 외부의 지정학적 위협에 대비하여 경제적 회복탄력성을 강화하려는 중국의 장기적인 국가 전략의 핵심 축이라 할 수 있다.
5. 주요 학술대회 발표 연구 동향 분석
2023년 2월은 산업계의 격변과 더불어, AI 및 로봇 공학 분야의 최신 연구 성과가 공유되는 중요한 학술의 장이기도 했다. 세계적인 학회인 AAAI-23과 ICLR-2023의 결과가 발표되고, 국내 최대 로봇 학회인 KRoC 2023이 개최되면서 학계의 주요 연구 동향을 파악할 수 있었다.
5.1 AAAI-23 (2023년 2월 7일-14일)
세계 최고 권위의 인공지능 학회인 제37회 AAAI(Association for the Advancement of Artificial Intelligence)에서는 AI 기술의 능력 확장과 동시에 그 근본적인 신뢰성에 대한 깊이 있는 성찰이 이루어졌다.21
**최우수 논문상(Outstanding Paper Award)**을 수상한 “Misspecification in Inverse Reinforcement Learning” (Joar Skalse, Alessandro Abate)은 AI 안전성 및 정렬(alignment) 연구에 중요한 화두를 던졌다.23 역강화학습(IRL)은 에이전트의 행동을 관찰하여 그 보상 함수(목표)를 추론하는 기술로, 인간의 의도를 AI에 학습시키는 데 핵심적인 역할을 한다. 이 논문은 기존 IRL 모델들이 에이전트의 행동 모델에 대해 비현실적인 가정을 하고 있으며(misspecification), 이러한 잘못된 가정에 기반한 추론이 실제 데이터에 적용될 경우 사소한 모델의 오류가 보상 함수 추론에서 매우 큰 오차로 이어질 수 있음을 수학적으로 증명했다.25 이는 우리가 AI를 인간의 의도에 맞게 정렬시키는 방법론 자체가 얼마나 취약할 수 있는지를 보여주는 경고였다.
이와 함께 **우수 논문(Distinguished Papers)**으로 선정된 연구들은 AI 기술의 다양한 최전선을 보여주었다. 그래프 신경망(GNN)의 과적합 및 과평탄화 문제를 해결하기 위한 새로운 드롭아웃 기법을 제안한 “DropMessage”, 이미지와 포인트 클라우드 데이터를 결합하여 3D 손 자세 추정의 정확도를 높인 “Two Heads are Better than One”, 다양한 강도의 적대적 공격에 강인한 신경망 아키텍처를 탐색하는 “Neural Architecture Search for Wide Spectrum Adversarial Robustness” 등이 주목받았다.23 특히 “CowClip“은 CTR(클릭률) 예측 모델의 학습 시간을 단일 GPU에서 12시간에서 10분으로 단축하는 혁신적인 최적화 기법을 제시하여 대규모 AI 모델의 효율성 문제를 다루었으며, “SimFair“는 다중 레이블 분류 문제에서 공정성을 확보하기 위한 새로운 프레임워크를 제안했다.
| 수상 부문 | 논문 제목 | 저자 | 핵심 기여 (초록 요약) |
|---|---|---|---|
| 최우수 논문상 | Misspecification in Inverse Reinforcement Learning | Joar Skalse, Alessandro Abate | 역강화학습(IRL)에서 행동 모델의 잘못된 가정이 보상 함수 추론에 미치는 영향을 분석하고, 사소한 오류가 큰 추론 실패로 이어질 수 있음을 수학적으로 규명함.25 |
| 우수 논문상 | DropMessage: Unifying Random Dropping for Graph Neural Networks | Taoran Fang, et al. | GNN의 메시지 전달 과정에 직접 드롭아웃을 적용하는 ’DropMessage’를 제안하여 과적합, 과평탄화 문제를 완화하고, 기존 드롭아웃 기법들을 통합하는 이론적 프레임워크를 제시함.27 |
| 우수 논문상 | Two Heads are Better than One: Image-Point Cloud Network for Depth-Based 3D Hand Pose Estimation | Pengfei Ren, et al. | 2D 이미지의 시각적 표현과 3D 포인트 클라우드의 기하학적 정보를 결합한 하이브리드 네트워크(IPNet)를 통해 깊이 기반 3D 손 자세 추정의 정확성과 강인성을 크게 향상시킴.29 |
| 우수 논문상 | Neural Architecture Search for Wide Spectrum Adversarial Robustness | Zhi Cheng, et al. | 다양한 강도의 적대적 공격에 대해 전반적으로 강인한 성능을 보이는 신경망 아키텍처를 자동으로 탐색하는 Wsr-NAS 프레임워크를 제안함.31 |
| 우수 논문상 | CowClip: Reducing CTR Prediction Model Training Time from 12 hours to 10 minutes on 1 GPU | Zangwei Zheng, et al. | 대규모 배치 학습 시 CTR 예측 모델의 불안정성을 해결하는 적응형 클리핑 기법(CowClip)을 개발하여, 정확도 손실 없이 학습 시간을 획기적으로 단축함.33 |
| 우수 논문상 | DICNet: Deep Instance-Level Contrastive Network for Double Incomplete Multi-View Multi-Label Classification | Chengliang Liu, et al. | 뷰(view)와 레이블(label)이 모두 불완전한 데이터 환경에서 딥러닝과 대조 학습을 활용하여 강인한 다중 뷰, 다중 레이블 분류를 수행하는 DICNet을 제안함.35 |
| 우수 논문상 | Exploring Tuning Characteristics of Ventral Stream’s Neurons for Few-Shot Image Classification | Lintao Dong, et al. | 인간의 뇌 시각 피질(ventral stream) 뉴런의 튜닝 특성을 계산적으로 모델링하고, 이를 소수샷 학습(few-shot learning) 모델에 정규화로 적용하여 성능을 향상시키는 신경과학 기반 접근법을 제시함.37 |
| 우수 논문상 | MaskBooster: End-to-End Self-Training for Sparsely Supervised Instance Segmentation | Shida Zheng, et al. | 일부 데이터에만 마스크 주석이 있는 희소 감독 환경에서, 교사-학생 모델 기반의 자기 학습(self-training) 프레임워크를 통해 인스턴스 분할 성능을 크게 향상시키는 MaskBooster를 제안함.39 |
| 우수 논문상 | SimFair: A Unified Framework for Fairness-Aware Multi-Label Classification | Tianci Liu, et al. | 다중 레이블 분류 문제에 대해 기존의 공정성 개념(DP, EOp)을 확장하고, 레이블이 유사한 데이터를 활용하여 소수 레이블에 대한 공정성 측정을 안정화하는 SimFair 프레임워크를 제안함.40 |
| 우수 논문상 | XRand: Differentially Private Defense against Explanation-Guided Attacks | Truc Nguyen, et al. | 설명가능 AI(XAI)가 제공하는 모델 설명을 역이용하는 백도어 공격에 대응하기 위해, 설명 자체에 차분 프라이버시(LDP)를 적용하여 중요 피처 정보를 보호하는 방어 기법 XRAND를 제안함.42 |
표 2: AAAI-23 주요 수상 논문 요약 (자료: 23)
5.2 ICLR-2023 (최종 결정 2023년 1월 20일)
ICLR(International Conference on Learning Representations)은 5월에 개최되었으나, 채택 논문은 1월 말에 확정되어 2월에는 학계의 주요 논의 대상이 되었다.44 ICLR-2023의 최우수 논문들은 AI의 표현 학습 능력이 어디까지 확장되고 있는지를 명확히 보여주었다.45
- “DreamFusion: Text-to-3D using 2D Diffusion”: 텍스트 설명만으로 고품질의 3D 모델을 생성하는 기술을 선보이며 생성형 AI의 영역을 2D 이미지에서 3D 공간으로 확장했다.
- “Rethinking the Expressive Power of GNNs via Graph Biconnectivity”: 그래프 신경망(GNN)의 표현력 한계를 그래프의 이중연결성(biconnectivity)이라는 새로운 관점에서 분석하여 GNN의 이론적 기반을 심화시켰다.
- “Universal Few-shot Learning of Dense Prediction Tasks with Visual Token Matching”: 소수의 예시만으로도 새로운 객체를 학습하는 소수샷 학습(few-shot learning) 능력을 크게 향상시켰다.
- “Emergence of Maps in the Memories of Blind Navigation Agents”: 시각 정보 없이도 환경을 탐색하는 에이전트의 기억 속에서 자연스럽게 ’지도’와 같은 공간 표상이 나타나는 현상을 발견하여, 체화된 AI(embodied AI) 연구에 중요한 시사점을 제공했다.
5.3 제18회 한국로봇종합학술대회 (KRoC 2023, 2월 15일-18일)
국내 최대 규모의 로봇 학회인 KRoC 2023은 “로봇은 다음 20년을 꿈꾸는가?“라는 주제 아래 강원도 평창에서 개최되었다.46 이 학회는 국내 로봇 연구의 현주소와 미래 방향성을 조망하는 자리였다.
기조강연에서는 조영조 ETRI 책임연구원이 ’ICT 융합 서비스 로봇’의 역사와 전망을, 정재승 KAIST 교수가 ’뇌과학 기반 AI(Brain-inspired AI)’를 로봇에 접목하는 연구를 발표했다. 특별강연에서는 SF 전문가들이 ’로봇공학 3원칙’과 같은 윤리적 상상력에 대해 논하며 기술과 인문학의 융합을 모색했다.47
초청강연 및 13개의 특별 세션에서는 소프트 로봇, 수술 보조 로봇, 마이크로/나노 로봇, 동적 보행 로봇과 같은 하드웨어 기술부터 해양 로봇, 방역 로봇, 스마트 온실 로봇 등 특정 응용 분야에 이르기까지 폭넓은 연구가 다루어졌다.47 이는 국내 로봇 연구가 기초 기술 개발을 넘어, 실제 산업 및 사회 문제 해결을 위한 구체적인 솔루션 개발로 나아가고 있음을 보여주었다.
종합적으로 2023년 2월의 학술 동향은 AI 기술의 능력(capability)과 정렬(alignment) 사이의 심화되는 간극을 드러냈다. ICLR에서는 3D 생성, GNN 표현력 강화 등 AI의 능력을 확장하는 연구가 주목받은 반면, AAAI에서는 최고 영예의 상이 AI 정렬 방법론의 근본적인 취약성을 지적한 이론 연구에 돌아갔다. 이는 AI의 능력이 기하급수적으로 발전하는 동안, 그 힘을 안전하게 통제하고 인간의 의도에 맞게 유도하는 기술의 이론적 기반은 여전히 해결해야 할 과제가 많다는 연구 커뮤니티 내부의 중요한 자기 성찰을 반영한다.
6. 결론: 2023년 2월이 시사하는 AI 및 로봇의 미래
2023년 2월은 AI 및 로봇 공학 분야의 미래를 결정지을 핵심적인 서사들이 응축되어 나타난 한 달이었다. 이 시기의 동향을 종합하면, 기술 발전의 방향성과 지정학적 경쟁 구도, 그리고 학문적 과제에 대한 몇 가지 중요한 결론을 도출할 수 있다.
첫째, AI 개발 패러다임은 ’폐쇄적 경쟁’과 ’개방적 민주화’라는 두 축의 긴장 관계 속에서 전개될 것이다. Google의 Bard 발표는 ChatGPT가 촉발한 빅테크 간의 치열한 기술 패권 경쟁을 상징한다. 이 경쟁은 막대한 자본과 데이터를 동원하여 모델의 성능을 극한으로 끌어올리는 폐쇄적 개발을 가속화할 것이다. 반면, Meta의 LLaMA 공개와 그에 따른 가중치 유출은 고성능 파운데이션 모델에 대한 접근성을 극적으로 높여, 전 세계 연구자와 개발자들이 참여하는 개방형 혁신 생태계의 기폭제가 되었다. 이 두 힘의 상호작용은 향후 AI 기술 발전의 속도와 방향을 결정하는 핵심 동력이 될 것이다.
둘째, 주요 기술 강국들은 AI 소프트웨어와 로봇 하드웨어를 결합한 산업 전략을 국가적 차원에서 추진하고 있다. 미국 중심의 빅테크 기업들이 생성형 AI라는 소프트웨어 혁신에 집중하는 동안, 중국은 ‘로봇+’ 계획을 통해 로봇 하드웨어를 제조업, 농업, 의료 등 국가 기간산업에 깊숙이 통합하는 전략을 명확히 했다. 이는 AI 시대의 경쟁력이 단순히 알고리즘의 우수성에만 있는 것이 아니라, 이를 물리적 세계와 연결하는 로봇 기술의 산업화 및 적용 능력에 있음을 시사한다. 미래의 기술 패권은 소프트웨어 혁신과 하드웨어 기반 산업의 시너지를 누가 더 효과적으로 창출하는가에 따라 결정될 가능성이 높다.
셋째, AI 기술의 ‘능력(Capability)’ 발전 속도와 ’안전성 및 정렬(Safety & Alignment)’에 대한 이론적 이해 사이의 격차가 심화되고 있다. ICLR에서 주목받은 연구들이 3D 생성, 소수샷 학습 등 AI의 능력을 새로운 차원으로 끌어올린 반면, AAAI의 최우수 논문은 AI를 인간의 의도에 맞추려는 핵심 기술(IRL)의 근본적인 취약성을 경고했다. 이는 AI의 힘은 나날이 강력해지지만, 그 힘을 안전하게 통제하고 인류에게 유익한 방향으로 유도할 수 있다는 우리의 확신은 그 속도를 따라가지 못하고 있음을 의미한다. 이 간극을 줄이는 것은 AI 분야의 가장 시급하고 중요한 학문적, 윤리적 과제로 남을 것이다.
결론적으로 2023년 2월은 생성형 AI의 대중화, 기술 패권 경쟁의 본격화, 로봇 산업의 국가 전략화, 그리고 AI 안전성에 대한 근본적 성찰이 동시에 분출된 변곡점이었다. 이 시기에 제시된 기술적, 정책적, 학문적 화두들은 이후 2023년 내내, 그리고 앞으로 다가올 미래의 AI 및 로봇 시대를 규정하는 핵심적인 흐름으로 자리 잡게 되었다.
7. 참고 자료
- AIoT 월간 동향, https://www.aiotkorea.or.kr/2023/webzine/KIoT/(2023-06)AIoTmonthlyissues.pdf
- 2023 국내 AI 도입 및 활용 현황 조사 | 인사이트리포트 | 삼성SDS, https://www.samsungsds.com/kr/insights/2023-ai-survey.html
- Llama (language model) - Wikipedia, https://en.wikipedia.org/wiki/Llama_(language_model)
- LLaMA: Open and Efficient Foundation Language Models - Meta …, https://research.facebook.com/publications/llama-open-and-efficient-foundation-language-models/
- 챗GPT가 쏘아 올린 AI 전쟁의 신호탄, 승자는 누가 될 것인가? | e경제정보리뷰 | KDI 경제교육, https://eiec.kdi.re.kr/publish/reviewView.do?ridx=14&idx=143&fcode=000020003600003
- Paper page - LLaMA: Open and Efficient Foundation Language Models - Hugging Face, https://huggingface.co/papers/2302.13971
- [2302.13971] LLaMA: Open and Efficient Foundation Language Models - arXiv, https://arxiv.org/abs/2302.13971
- Introduction to Meta AI’s LLaMA: Empowering AI Innovation | DataCamp, https://www.datacamp.com/blog/introduction-to-meta-ai-llama
- An important next step on our AI journey - Google Blog, https://blog.google/intl/en-africa/products/explore-get-answers/an-important-next-step-on-our-ai-journey/
- [2201.08239] LaMDA: Language Models for Dialog Applications - ar5iv - arXiv, https://ar5iv.labs.arxiv.org/html/2201.08239
- LaMDA: Language Models for Dialog Applications, https://arxiv.org/pdf/2201.08239
- 2023: A year of groundbreaking advances in AI and computing - Google Research, https://research.google/blog/2023-a-year-of-groundbreaking-advances-in-ai-and-computing/
- Google Search February 2023 Product Review & AI Content Update - Digiligo, https://digiligo.com/blog/february-2023-product-review-ai-content-update/
- Google Search’s guidance about AI-generated content, https://developers.google.com/search/blog/2023/02/google-search-and-ai-content
- China to boost density of manufacturing robots, https://english.www.gov.cn/statecouncil/ministries/202301/20/content_WS63c9d296c6d0a757729e5e28.html
- China: Adoption of “Robot +” application action implementation plan - Global Trade Alert, https://globaltradealert.org/state-act/76508-china-adoption-of-robot-application-action-implementation-plan
- 주요국의 지능로봇 정책 추진 현황과 시사점, https://ettrends.etri.re.kr/ettrends/208/0905208003/025-035.%20%EA%B3%A0%EC%88%9C%EC%A3%BC_208%ED%98%B8%20%EC%B5%9C%EC%A2%85.pdf
- 인간 중심 로봇의 현황 및, https://nia.or.kr/common/board/Download.do?bcIdx=27644&cbIdx=66361&fileNo=1
- Understanding the new five-year development plan for the robotics industry in China, https://ifr.org/post/understanding-the-new-five-year-development-plan-for-the-robotics-industry-in-china
- China’s Robots Are Coming of Age - Centre for International Governance Innovation, https://www.cigionline.org/articles/chinas-robots-are-coming-of-age/
- AAAI-23: Call for Papers | AAAI 2023 Conference, https://aaai-23.aaai.org/aaai23call/
- AAAI 2023 Conference | Thirty-Seventh AAAI Conference on Artificial Intelligence, https://aaai-23.aaai.org/
- AAAI-23 is pleased to announce the winners of the … - AAAI 2023, https://aaai-23.aaai.org/wp-content/uploads/2023/02/AAAI-23-Paper-Awards-1.pdf
- Outstanding Paper Award at AAAI23 Conference on Artificial Intelligence, https://www.cs.ox.ac.uk/news/2125-full.html
- Congratulations to the #AAAI2023 best paper winners - ΑΙhub - AI Hub, https://aihub.org/2023/02/11/congratulations-to-the-aaai2023-best-paper-winners/
- Quantifying the Sensitivity of Inverse Reinforcement Learning to Misspecification, https://openreview.net/forum?id=pz2E1Q9Wni¬eId=RaDsDdEkDo
- DropMessage: Unifying Random Dropping for Graph Neural Networks - AAAI Publications, https://ojs.aaai.org/index.php/AAAI/article/view/25545/25317
- DropMessage: Unifying Random Dropping for Graph Neural Networks | Request PDF - ResearchGate, https://www.researchgate.net/publication/371919365_DropMessage_Unifying_Random_Dropping_for_Graph_Neural_Networks
- Two Heads Are Better than One: Image-Point Cloud Network for Depth-Based 3D Hand Pose Estimation | Request PDF - ResearchGate, https://www.researchgate.net/publication/371934994_Two_Heads_Are_Better_than_One_Image-Point_Cloud_Network_for_Depth-Based_3D_Hand_Pose_Estimation
- Two Heads Are Better than One: Image-Point Cloud Network for Depth-Based 3D Hand Pose Estimation, https://ojs.aaai.org/index.php/AAAI/article/view/25310/25082
- Neural Architecture Search for Wide Spectrum Adversarial Robustness - ResearchGate, https://www.researchgate.net/publication/371929532_Neural_Architecture_Search_for_Wide_Spectrum_Adversarial_Robustness
- Neural Architecture Search for Wide Spectrum Adversarial Robustness, https://ojs.aaai.org/index.php/AAAI/article/view/25118/24890
- CowClip: Reducing CTR Prediction Model Training Time from 12 hours to 10 minutes on 1 GPU | Request PDF - ResearchGate, https://www.researchgate.net/publication/359936881_CowClip_Reducing_CTR_Prediction_Model_Training_Time_from_12_hours_to_10_minutes_on_1_GPU
- CowClip: Reducing CTR Prediction Model Training Time from 12 Hours to 10 Minutes on 1 GPU - AAAI Publications, https://ojs.aaai.org/index.php/AAAI/article/view/26347/26119
- DICNet: Deep Instance-Level Contrastive Network for Double Incomplete Multi-View Multi-Label Classification - ResearchGate, https://www.researchgate.net/publication/371918764_DICNet_Deep_Instance-Level_Contrastive_Network_for_Double_Incomplete_Multi-View_Multi-Label_Classification
- DICNet: Deep Instance-Level Contrastive Network for Double Incomplete Multi-View Multi-Label Classification, https://ojs.aaai.org/index.php/AAAI/article/view/26059/25831
- Exploring Tuning Characteristics of Ventral Stream’s Neurons for Few-Shot Image Classification | Request PDF - ResearchGate, https://www.researchgate.net/publication/371923886_Exploring_Tuning_Characteristics_of_Ventral_Stream’s_Neurons_for_Few-Shot_Image_Classification
- Exploring Tuning Characteristics of Ventral Stream’s Neurons for Few-Shot Image Classification, https://ojs.aaai.org/index.php/AAAI/article/view/25128/24900
- MaskBooster: End-to-End Self-Training for Sparsely Supervised Instance Segmentation, https://ojs.aaai.org/index.php/AAAI/article/view/25481/25253
- SimFair: A Unified Framework for Fairness-Aware Multi-Label Classification - ResearchGate, https://www.researchgate.net/publication/371929284_SimFair_A_Unified_Framework_for_Fairness-Aware_Multi-Label_Classification
- SimFair: A Unified Framework for Fairness-Aware Multi-Label Classification - arXiv, https://arxiv.org/abs/2302.09683
- XRand: Differentially Private Defense against Explanation-Guided Attacks, https://ojs.aaai.org/index.php/AAAI/article/view/26401/26173
- XRand: Differentially Private Defense against Explanation-Guided Attacks (Journal Article) | NSF PAGES, https://par.nsf.gov/biblio/10426202-xrand-differentially-private-defense-against-explanation-guided-attacks
- 2023 - Call For Papers - ICLR 2026, https://iclr.cc/Conferences/2023/CallForPapers
- Eleventh ICLR Unveils Outstanding Paper Award Winners ICLR 2023 is the first major AI and deep learning conference gathering in Kigali, Africa, https://www.iclr.cc/media/Press/ICLR_2023_Press_Release.pdf
- 국내학술대회 - 한국로봇학회, https://kros.org/Conference/ConferenceView.asp?AC=0&CODE=CC20220801&B_CATE=bbc1
- ‘제18회 한국로봇종합학술대회’, 2월 15일 개막 - 로봇신문, http://www.irobotnews.com/news/articleView.html?idxno=30674